GWT: Compresión escalable del estado del optimizador para el entrenamiento de modelos de lenguaje grandes
GWT ofrece compresión escalable del estado del optimizador para LLMs, reduciendo memoria en entrenamiento sin sacrificar rendimiento. Optimiza modelos de lenguaje grandes de forma eficiente.